学习机器人技能通常被称为SIM2REAL的实用方法是培训仿真中的控制政策,然后在真正的机器人上部署它们。流行的技术改进域随机化的SIM2REAL转移构建(DR):培训对各种随机产生的域的政策,希望能够更好地推广到现实世界。由于策略学习和DR算法中的大量超参数,一个经常最终有大量训练有素的型号,在那里选择最佳模型需要对真正的机器人进行昂贵的评估。在这项工作中,我们问:我们可以在没有在现实世界中跑步的情况下对政策进行排名吗?我们的主要思想是,可以使用预定义的真实世界数据来评估所有策略,使用分配检测(OOD)技术。从某种意义上说,这种方法可以被视为“单位测试”,以评估任何真实世界的执行前的政策。然而,我们发现本身,ood得分可能对特定的ood方法非常敏感。我们的主要贡献是一个简单尚有效的政策分数,在模拟中结合了ood。我们表明我们的得分 - VSDR - 可以显着提高政策排名的准确性,而无需额外的现实数据。我们评估VSD对具有图像输入的机器人抓握任务中SIM2REAL转移的有效性。我们广泛地评估不同的DR参数和ood方法,并显示VSDR改善了电路板上的政策选择。更重要的是,我们的方法达到了更好的排名,与基线相比使用显着更少的数据。
translated by 谷歌翻译
Collecting large-scale medical datasets with fully annotated samples for training of deep networks is prohibitively expensive, especially for 3D volume data. Recent breakthroughs in self-supervised learning (SSL) offer the ability to overcome the lack of labeled training samples by learning feature representations from unlabeled data. However, most current SSL techniques in the medical field have been designed for either 2D images or 3D volumes. In practice, this restricts the capability to fully leverage unlabeled data from numerous sources, which may include both 2D and 3D data. Additionally, the use of these pre-trained networks is constrained to downstream tasks with compatible data dimensions. In this paper, we propose a novel framework for unsupervised joint learning on 2D and 3D data modalities. Given a set of 2D images or 2D slices extracted from 3D volumes, we construct an SSL task based on a 2D contrastive clustering problem for distinct classes. The 3D volumes are exploited by computing vectored embedding at each slice and then assembling a holistic feature through deformable self-attention mechanisms in Transformer, allowing incorporating long-range dependencies between slices inside 3D volumes. These holistic features are further utilized to define a novel 3D clustering agreement-based SSL task and masking embedding prediction inspired by pre-trained language models. Experiments on downstream tasks, such as 3D brain segmentation, lung nodule detection, 3D heart structures segmentation, and abnormal chest X-ray detection, demonstrate the effectiveness of our joint 2D and 3D SSL approach. We improve plain 2D Deep-ClusterV2 and SwAV by a significant margin and also surpass various modern 2D and 3D SSL approaches.
translated by 谷歌翻译
自我监督的学习允许AI系统使用不需要昂贵的标签的任务从大量数据中学习有效表示。模式崩溃,即为所有输入产生相同表示形式的模型,是许多自我监督学习方法的核心问题,可以使自我监督任务(例如匹配输入的变形变体)无效。在本文中,我们认为,同一输入的替代潜在表示之间信息最大化的直接应用自然解决了崩溃问题并实现了竞争性的经验结果。我们提出了一种自我监督的学习方法Corinfomax,该方法使用了基于二阶统计的共同信息度量,以反映其参数之间的相关性水平。在同一输入的替代表示之间最大化此相关信息度量有两个目的:(1)它通过生成具有非脱位协方差的特征向量来避免崩溃问题; (2)通过增加它们之间的线性依赖性,它在替代表示之间建立了相关性。提出的信息最大化客观的近似简化为基于欧几里得距离的目标函数,该目标函数由特征协方差矩阵的对数确定因素正规化。正则术语是针对特征空间退化的自然障碍。因此,除了避免完全输出崩溃到一个点外,提出的方法还通过鼓励信息在整个特征空间中的传播来防止尺寸崩溃。数值实验表明,相对于最先进的SSL方法,Corinfomax取得更好或竞争性的性能结果。
translated by 谷歌翻译
与诊断放射学相关的患者护理质量与医师工作量成正比。分割是诊断和治疗程序的基本限制前体。机器学习的进步(ML)旨在提高诊断效率,以用广义算法替代单个应用程序。在无监督的异常检测(UAD)中,基于卷积神经网络(CNN)自动编码器(AES)和变异自动编码器(VAE)被视为基于重建的异常分段的事实方法。在医学图像中寻找异常区域是使用异常分割的主要应用之一。 CNN中受限制的接收场限制了CNN对全局上下文进行建模,因此,如果异常区域涵盖了图像的一部分,则基于CNN的AES无法带来对图像的语义理解。另一方面,视觉变压器(VIT)已成为CNN的竞争替代品。它依赖于能够将图像斑块相互关联的自我发挥机制。为了重建一个连贯和更现实的图像,在这项工作中,我们研究了变形金刚在为基于重建的UAD任务构建AES的功能中。我们专注于用于大脑磁共振成像(MRI)的异常分割,并呈现五个基于变压器的模型,同时可以使分割性能可比或与最新模型(SOTA)模型相当。源代码可在github https://github.com/ahmedgh970/transformers_unsupervise_anomaly_segentation.git上获得
translated by 谷歌翻译
缺乏培训数据和实例级注释,对罕见性贫血疾病的深度分类受到挑战。多个实例学习(MIL)已证明是一个有效的解决方案,但其精度较低和有限的解释性遭受。尽管关注机制的包含已经解决了这些问题,但它们的有效性很大程度上取决于训练样本中细胞的数量和多样性。因此,从血液样本中罕见的贫血障碍分类的机器学习表现不佳。在本文中,我们提出了一种可解释的合并方法,以解决这些局限性。通过从负面袋的实例级信息(即,来自健康个体的均质细胞)中受益,我们的方法增加了异常实例的贡献。我们表明,我们的战略优于标准的MIL分类算法,并在决策背后提供了有意义的解释。此外,它可以表示在训练阶段未见的罕见血液疾病的异常情况。
translated by 谷歌翻译
诊断血液系统恶性肿瘤需要鉴定和分类外周血涂片中的白细胞。由不同的实验室程序,染色,照明和显微镜设置引起的域移位阻碍了最近开发的机器学习方法对从不同站点收集的数据的重复性。在这里,我们提出了一个跨域改编的自动编码器,以在三个不同的白色血细胞中从外周血涂片扫描的单个白细胞的三个不同数据集中提取特征。自动编码器基于R-CNN架构,使其专注于相关的白色血细胞并消除图像中的伪影。为了评估提取特征的质量,我们使用简单的随机森林对单个细胞进行分类。我们表明,由于仅在一个数据集中训练的自动编码器提取的丰富功能,随机森林分类器在看不见的数据集上表现出色,并且在交叉域任务中超越了Oracle网络。我们的结果表明,可以在更复杂的诊断和预后任务中采用这种无监督的方法,而无需添加昂贵的专家标签来看不见数据。
translated by 谷歌翻译
由于监督学习模型的培训中的高成本和数据限制,自我监督学习(SSL)最近引起了很多关注。 SSL中的当前范式是利用输入空间的数据增强来创建相同图像的不同视图并训练模型以最大化相似图像之间的表示,并最大程度地减少它们的不同图像。尽管这种方法实现了最新的(SOTA),但仍会实现各种下游任务,但它仍然有机会调查潜在的空间扩展。本文提出了Trimix,这是SSL的一种新颖概念,该概念通过数据的线性插值生成虚拟嵌入,从而为模型提供了新的表示。我们的策略着重于训练模型,以从虚拟的嵌入中提取原始嵌入,从而更好地表示学习。此外,我们提出了一个自称术语,可以提高虚拟嵌入和实际嵌入之间的一致性。我们在八个基准数据集上验证了Trimix,这些数据集由天然和医学图像组成,提高了2.71%和0.41%,比两种数据类型的第二好的模型好。此外,我们的方法表现优于半监督学习中的当前方法,尤其是在低数据制度中。此外,我们的预训练模型显示出更好的传输到其他数据集。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
在全球范围内,皮肤癌是最致命的疾病之一。每年有数百万人被诊断出患有这种癌症。窗台,早期检测可以大大降低药物成本和死亡率。最近使用深度学习方法的自动癌症分类的改进已经达到了需要在一个位置组装的大量注释数据的人级性能,但发现这种情况通常是不可行的。最近,已经提出联合学习(FL)以隐私保存的方式培训分散模型,具体取决于客户端的标记数据,通常不可用且昂贵。为了解决这个问题,我们提出了一个半监督联合学习方法的Fedperl。我们的方法是通过从教育心理学和委员会机器的平均的同伴学习的启发。 FedPerl基于客户的相似性构建社区。然后它鼓励社区成员彼此学习,以为未标记的数据生成更准确的伪标签。我们还提出了对PEER匿名化(PA)技术来提高隐私。作为我们方法的核心组件,PA与其他方法正交而无需额外复杂性并且在增强性能的同时降低通信成本。最后,我们提出了一种动态的同伴学习策略,可以控制学习流,以避免性能下的任何劣化,特别是对于各个客户端。我们的实验设置由来自5个公共数据集收集的71,000个皮肤病变图像组成。凭借很少的注释数据,Fedperl分别优于最先进的SSFL和基线,分别为1.8%和15.8%。此外,它将更好地概括为一个看不见的客户,同时对噪音不太敏感。
translated by 谷歌翻译
Data-driven Machine Learning has emerged as a promising approach for building accurate and robust statistical models from medical data, which is collected in huge volumes by modern healthcare systems. Existing medical data is not fully exploited by ML primarily because it sits in data silos and privacy concerns restrict access to this data. However, without access to sufficient data, ML will be prevented from reaching its full potential and, ultimately, from making the transition from research to clinical practice. This paper considers key factors contributing to this issue, explores how Federated Learning (FL) may provide a solution for the future of digital health and highlights the challenges and considerations that need to * Disclaimer: The opinions expressed herein are those of the authors and do not necessarily represent those of the institutions they are affiliated with, e.g. the U.S. Department of Health and Human Services or the National Institutes of Health. This is a pre-print version of https://www.nature.com/articles/s41746-020-00323-1 be addressed.
translated by 谷歌翻译